和大部分的公開資料集一樣,都起源於學術競賽,其中針對ImageNet的大型視覺挑戰賽ILSVRC從2010年成立就非常受歡迎,而這項競賽每年的挑戰內容都不盡相同,有圖片分類、物體定位、物體辨識、場景分類和場景解析等。
在這個資料及總共只有十種類別,分別是飛機、汽車、青蛙、馬、船、卡車、鳥、貓、鹿、狗,是彩色圖片的資料集,有三個channel。而cifar100顧名思義就是他有100個類別,且總共有60000張相片,一個類別600張,其中500是訓練資料,100是測試資料。他還分有fine_labels和coarse_labels,這兩這代表的是圖像的顆粒粗細,是一個有層次的資料集。
他是一個手寫數字資料集,其中包含 60000 張手寫數字圖像,這些圖像為 250 個人的字跡有趣的是他一半是由高中生寫的,另外一半則是人口普查局的員工,以此來確保這些數字有許多不同的風格所有圖像都是由 28 × 28 個像素組成的「灰階」(Grayscale) 圖像。
參考資料:https://datasciocean.tech/deep-learning-core-concept/mnist-dataset-and-cost-function/